Clustering for categorial grammar induction (Inférence grammaticale guidée par clustering) [in French]
نویسنده
چکیده
Clustering for categorial grammar induction In this article, we describe the way we use hierarchical clustering to learn an AB grammar from partial derivation trees. We describe AB grammars and the derivation trees we use as input for the clustering, then the way we extract information from Treebanks for the clustering. The unification algorithm, based on the information extracted from our cluster, will be explained and the results discussed. MOTS-CLÉS : grammaires catégorielles, clustering hiérarchique, inférence grammaticale.
منابع مشابه
A discriminative parser of the LR family for phrase structure parsing (Un analyseur discriminant de la famille LR pour l'analyse en constituants) [in French]
We provide a new weighted parsing algorithm for deterministic context free grammar parsing inspired by LR (Knuth, 1965). The parser is weighted by a discriminative model that allows determinism (Collins, 2002). We show that the discriminative model allows to take advantage of morphological information available in the data, hence allowing to achieve state of the art results both in time and in ...
متن کاملLearning Recursive Automata from Positive Examples
In this theoretical paper, we compare the “classical” learning techniques used to infer regular grammars from positive examples with the ones used to infer categorial grammars. To this aim, we first study how to translate finite state automata into categorial grammars and back. We then show that the generalization operators employed in both domains can be compared, and that their result can alw...
متن کاملInférence grammaticale et grammaires catégorielles: vers la Grande Unification!
Résumé : Dans cet article, nous proposons de comparer les techniques employées en inférence grammaticale de langages réguliers par exemples positifs avec celles employées pour l’inférence de grammaires catégorielles. Pour cela, nous commençons par étudier la traduction entre automates et grammaires catégorielles, et inversement. Nous montrons ensuite que l’opérateur de généralisation utilisé po...
متن کاملCombinaisons d'automates et de boules de mots pour la classification de séquences
Dans cet article, nous présentons un cadre d'apprentissage général pour la classi cation supervisée. Ce cadre ne nécessite que la dé nition d'un opérateur de généralisation et fournit en particulier des méthodes d'ensemble. Pour les tâches de classi cation de séquences, nous montrons que l'inférence grammaticale, avec des objectifs di érents, a déjà dé ni de tels apprenants pour certaines famil...
متن کاملTreating ellipsis : two abstract categorial grammar perspectives (Traitements d'ellipses : deux approches par les grammaires catégorielles abstraites) [in French]
Treating ellipsis : two abstract categorial grammar perspectives The treatment of ellipsis in models of the syntax-semantics interface is troublesome as the linguistic material removed in the phonologic interpretation is still necessary in the semantics. Examples are particular cases of coordination, especially the ones involving verbal phrase ellipsis or subject elision. We show a way to use a...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2013